[Home] Python으로 돌아가기

사이킷런(scikit-learn) - 개요, 설치, 주요 기능

📚 목차

1. 사이킷런이란?

2. 설치 방법

3. 주요 기능 소개

4. 널리 사용되는 함수 및 도구

5. 자주 사용되는 알고리즘 유형

6. 예제 코드

7. 정리


1. 사이킷런이란?

사이킷런(scikit-learn)은 파이썬에서 머신러닝 모델을 손쉽게 구현할 수 있도록 개발된 오픈소스 라이브러리이다. 본 라이브러리는 데이터 전처리, 분류, 회귀, 클러스터링, 차원 축소, 모델 평가 등 다양한 머신러닝 작업을 지원한다.

2. 설치 방법

pip 명령어를 사용하여 설치할 수 있다.

pip install scikit-learn

3. 주요 기능 소개

4. 널리 사용되는 함수 및 도구

5. 자주 사용되는 알고리즘 유형

6. 예제 코드

아래는 붓꽃(Iris) 데이터를 이용하여 분류 모델을 학습하고 평가하는 예제이다.


from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

# 데이터 로딩
iris = load_iris()
X = iris.data
y = iris.target

# 훈련/테스트 데이터 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 모델 학습
clf = RandomForestClassifier()
clf.fit(X_train, y_train)

# 예측 및 평가
y_pred = clf.predict(X_test)
print(classification_report(y_test, y_pred))

7. 정리